其他
基本无害 | 管用的工具变量——工具变量和因果关系(三)
基本无害的计量经济学
——实证研究者指南
(重译本)
第四章 管用的工具变量:有时候你就是可以得你所需
第一节 工具变量和因果关系
正文共4269个字,预计阅读时间11分钟。感谢阅读!
原文:4.1.3
温馨提示:左右滑动可查看完整公式!
前文回顾:4.1.1 两阶段最小二乘
前文回顾:4.1.2 瓦尔德估计量
4.1.3 分组数据与2SLS
瓦尔德估计量可谓所有IV估计量之母,因为更复杂的2SLS估计量通常可以从瓦尔德估计量的基础集合中构建出来。瓦尔德和2SLS之间的联系是分组数据:使用虚拟工具变量的2SLS等同于基于一系列分组均值的GLS。换句话说,GLS可以理解为所有瓦尔德估计量的线性组合,这些瓦尔德估计量可以由均值组(pairs of means)构造而成。这种联系的普遍性似乎受到一种假设的限制,即所用的工具变量须是虚拟变量。并不是所有的工具变量都是虚拟变量,甚或是离散变量,但这实际上并不重要。首先,许多工具变量可以被认为是在定义类别,例如出生季度。此外,看起来更连续的工具变量(如抽签号,从1到365)通常可以被分成不同的组,也不会损失太多信息(例如,应征资格身份可以是一个单一的虚拟变量,也可以是25个抽签号为一组的虚拟变量)。[1]为了更全面地解释瓦尔德-分组-2SLS之间的联系,我们还是深耕抽签决定应征资格的那个研究。前面我们提到,应征资格是判断军人身份的一个值得关注的工具变量。1950年出生的男性应征资格上限为RSN 195,1951年出生的男性应征资格上限为RSN 125,1952年出生的男性应征资格上限为RSN 95。然而,实际上,抽签号(我们称之为 ,即RSN的缩写)和军人身份()之间的联系比应征资格身份本身更丰富多样。虽然抽签值超过资格上限的男性并未征召,但上限是多少事先是未知的。因此,有些人自愿参军,以期在更好的条件下服役,并获得对服役时间的一些控制权。对于抽签号码较低的男性来说,因自愿应召的驱动力很大,但对于抽签号码较高的男性来说,这种驱动力是很小的。因此,即使值严格高于或低于征召资格临界点, 也会有所变化。例如,1950年出生、抽签号码为200-225的男性比抽签号码为226-250的男性更有可能参军,尽管最终两组都没有人受到征召。瓦尔德估计量将征召资格作为1950年出生男性的一个工具变量,对 的男性的收入与 的男性的收入进行比较。但是前面的讨论表明了更多可能的比较,例如 的男性与 的男性相比, 的男性与 的男性相比,等等,直到这些25个数字的间隔被比较结束。我们也可以让间隔更细一些,比如说,用5或个位数的间隔来比较男性,而不是25个数的间隔。这种扩大比较的结果是得到一组瓦尔德估计量。这些集合是完全的,因为这些间隔划分了基础工具变量的支撑集合,而单个瓦尔德估计量之间是线性独立的,因为它们的分子是线性独立的。最后,只要 独立于潜在结果,并与军人身份相关(即瓦尔德估计量的分母不为零),那么,这些瓦尔德估计量中的每一个都一致地估计了相同的因果效应,这里假设它为常数。为相同的因果效应构建多个瓦尔德估计量的可能性,自然会引发如何处理所有这些估计量的问题。我们会想要给出一个单一的估计值,从而以某种方式有效地结合各个瓦尔德估计值中的信息。事实证明,一组线性无关的瓦尔德估计值的最有效的线性组合,是通过构建这些估计值的组平均值拟合一条直线产生的。分组数据估计量可以被直接引出如下。一如(4.1.11)中那样,我们使用二元常量因果效应模型,在这种情况下可以写成:其中 为我们感兴趣的因果效应,。由于 是随机分配的,而且假定抽签号除了通过军人身份之外对收入的影响别无它途,因此 。进一步可以推断:这是因为,。换句话说,将给定抽签号码时的平均收入与按抽签号码服兵役的平均概率联系起来的直线的斜率,等于服兵役所产生的影响 。而 对 的回归结果——在这种情况下,军人身份的对收入平均值的差异——几乎肯定异于 的事实,乃是因为 和 很可能相关所致。公式(4.1.15)表明,我们通过拟合 和 的样本对应物为一条直线来估计 。假设 的值为 。原则上, 可能从1取到365,但在Angrist(1990)中,抽签号码信息被聚合到69个5个数字的间隔中,加上数字间隔346-365一共70个间隔。因此,我们可以认为 从1到70。令 和 表示 和 的估计值,而 表示(4.1.14)中的平均误差。由于样本矩收敛于总体矩,因此可以得出分组方程中 的OLS估计值是一致的。然而,在实践中,广义最小二乘(GLS)可能是更可取的,因为分组方程具有已知方差结构的异方差性。对于常量因果效应线性模型中的分组数据,有效的GLS估计量是通过权重为 的方差的WLS估计而得(例如,可参见:Prais和Aitchison, 1954;或Wooldridge, 2006)。假设微观数据残差具有方差为 的同方差性,则这个方差权重为 ,其中 为组的大小。因此,我们应该按组大小来衡量权重,这在3.4.1节的各部分中讨论过。方程(4.1.16)中的的GLS(或WLS)估计量特别重要,原因有二。首先,由 组观测值构造的GLS斜率估计值是任意 个线性无关瓦尔德估计量的全集的渐近有效线性组合(Angrist, 1991)。这一点不需要任何数学运算就可以看出:GLS和瓦尔德估计量的任何线性组合都是分组因变量的线性组合。此外,对于分组数据,GLS是渐近有效的线性估计量。因此,我们可以得出结论,没有比GLS更好的(即更渐近有效的)瓦尔德估计量的线性组合(同样,这里也需要假设 ρ是常数)。由线性无关瓦尔德估计量的全集构造出GLS估计量的公式,可见于Angrist(1988)。其次,正如每个瓦尔德估计量也是一个IV估计量一样,方程(4.1.16)的GLS估计量也是2SLS的。在这种情况下,工具变量是标示每个抽签号码组别的虚拟变量的全集。要了解何以如此,我们来定义一组虚拟工具变量 ,其中 表示用于构造虚拟变量的指示函数。现在考虑 对 加一个常数的第一阶段回归。由于这第一阶段是饱和回归,拟合值应该是样本条件均值 ,对每个 重复 次。因此,第二阶段斜率估计值与分组方程(4.1.16)的WLS估计(其权重由组别大小 给出)所得的斜率相同。分组数据和2SLS之间的联系,在概念和实践上都具有重要意义。在概念上,任何使用一组虚拟工具变量的2SLS估计量都可以理解为使用这些工具变量产生的所有瓦尔德估计量的一个线性组合。瓦尔德估计量进而提供了一个简单的框架,可以在本章后面的章节中用来解释更现实的异质潜在结果世界中的IV估计值。虽然不是所有的工具变量本质上都是离散的,从而可以立即进行瓦尔德或分组数据解释,但很多工具变量都可以这样做。其中的例子包括征兵抽签号、出生季度、双胞胎,以及兄弟姐妹性别构成这些工具变量,这些我们已经讨论过。(也可以参见Bennedsen等人(2007年)和Ananat与Michaels(2008年)的最新研究,这两项研究都使用第一胎是否男孩作为虚拟变量的工具变量。)此外,具有连续意味的工具变量通常相当多都可以转化为离散变量。例如,Angrist、Graddy和Imbens(2000)将基于天气的连续工具变量重新编码为三个虚拟变量(暴风雨天气、晴朗天气和时阴时晴),然后他们用这些变量来估计对鱼类的需求。将这个虚拟变量的参数化,似乎可以捕捉天气条件和鱼类价格之间关系的主要特征。[2]在实践方面,2SLS的分组数据等价关系为我们提供了一个简单的工具,可以用来解释和评估任何IV策略。例如,在应征抽签的那种情况下,分组模型体现了这样一个假设:平均收入随抽签号码的变化而变化的唯一原因是不同抽签号码组服兵役的概率的变化。如果潜在的因果关系是线性的,且是常量因果效应,那么方程(4.1.16)应能很好地拟合组平均值,这是我们可以通过检验来评估的,在下一节,我们还会讨论如何使用正式的统计推断机制来加以评估。有时劳动经济学家将离散工具变量的分组数据图,称为可视化工具变量(VIV)。[3]Angrist(1990)就有这样一个例子,如图4.1.2所重制。这张图显示了出生在1950-53年的白人男性1981-1984年收入中,5个RSN数为间隔的组别平均收入与这些组别中服兵役的概率之间的关系。通过这些点的直线斜率是对因服兵役而造成的收入损失的IV估计值,在此例中约为2400美元,与之前讨论的瓦尔德估计值相差不大,但标准误差更低(在此例中约为800美元)。注释
[1] 一个例外是经典的测量误差模型,其中要工具化的变量和工具变量都假定是连续的。在这里,我们想到了涉及OVB的那些IV场景。
[2] 被编码为虚拟变量的连续工具变量可以被视为为潜在的第一阶段关系 提供了一个精简的非参数模型。在常系数同方差模型中, 是渐近有效工具变量(Newey, 1990)。
[3] 例如,参见Borjas(2005)的序言。
本专栏主理人简介
企研数据学术顾问 · 李井奎
李井奎,1978年1月生,浙江工商大学经济学院教授、博士生导师,哈佛大学访问学者,以教书育人和传播学问为己任,曾获浙江省“高校优秀教师”称号。除学术论文写作之外,还著有《大侦探经济学:现代经济学的因果推断革命》等科普著作。
星标⭐我们不迷路!想要文章及时到,文末“在看”少不了!
点击搜索你感兴趣的内容吧
往期推荐
数据Seminar
这里是大数据、分析技术与学术研究的三叉路口
文 | 《基本无害的计量经济学——实证研究者指南(重译本)》
翻译 | 李井奎
校对 | 陈泽 王锐
排版 | 彭绮荣
欢迎扫描👇二维码添加关注